聚类数据是无监督的机器学习领域的流行功能。大多数算法旨在找到提取一致数据簇的最佳方法,但其中很少有打算聚集在两个或更多功能之间共享相同相交的数据。本文提出了一种方法。这种新颖方法的主要思想是使用模糊C均值(FCM)算法生成模糊的数据簇。第二部分涉及应用一个选择最低和最大成员价值范围的过滤器,从而强调边框数据。 {\ mu}参数定义了此范围的幅度。它最终使用FCM生成的成员价值应用K均值算法。自然,具有相似会员价值的数据将在新的脆皮集群中重新组合。该算法还能够根据Silhouette索引(SI)给出的簇的一致性找到FCM和K-均值算法的最佳簇数。结果是一个数据和簇的列表,该列表重组数据共享相同的交叉点,与两个或更多功能相交。 CK均值允许提取自然而然地属于同一群集而是在两个或更多簇的相交的非常相似的数据。该算法也总是发现自己是簇的最佳数量。
translated by 谷歌翻译